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摘要 : Biotracks 是 一 款 自然 观察 类 的 公众 科学 应 用 ， 目 前 已 经 被 各 类 科学 调查 和 自然 观察 
项 目 广泛 使 用 。 我 们 利用 Biotracks 的 标本 采集 项 目 将 野外 采集 的 数据 与 标本 馆 的 数字 馆藏 
系统 连接 起 来 ， 使 用 户 在 手机 上 记录 的 信息 ， 可 以 被 应 用 到 标本 馆 的 标本 数字 化 之 中 。 这 种 
方式 不 仅 提升 了 数字 标本 的 转录 效率 , 还 从 根本 上 改变 了 整个 标本 收集 流程 中 的 数据 整合 方 
式 , 使 得 标本 从 采集 到 收藏 的 各 个 环节 都 能 够 获得 高 质量 的 效率 提升 。 同时， 新 的 标本 收集 
模式 还 能 够 自然 地 将 标本 的 野外 照片 与 数字 标本 融 为 一 体 , 从 而 使 得 传统 标本 原本 很 难 呈 现 
的 颜色 、 行 为 、 立 体 结构 、 环 境 等 信息 最 终 可 以 通过 数字 标本 再 次 展现 给 研究 者 。 这 不 仅 在 
信息 维度 上 拓展 了 传统 标本 的 内 涵 , 结合 公众 科学 , 未 来 还 有 望 进 一 步 延 伸 馆 藏 标本 鉴定 和 
讨论 的 时 空 范围 。 除 此 之 外 ,公众 科学 在 解决 标本 馆 问 题 中 所 展现 出 来 的 潜质 ， 也 为 我 们 重 
新 审视 标本 馆 的 领域 价值 提供 了 新 的 视角 。 
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Using the Biotracks platform to collect plant specimens 


XU Zhoufeng"", LIU Ende?, CHEN Jiahui 
(1. College of Forestry, Southwest Forestry University, Kunming 650224, China; 2. Key Laboratory for Plant 


Diversity and Biogeography of East Asia, Kunming Institute of Botany, Chinese Academy of Sciences, Kunming 
650201, China) 


Abstract: Biotracks is a citizen science platform of nature observation, which has been widely 
used in the scientific field survey and public nature observation in China. We use the collection 
object of Biotracks to link the data collected in the field to the digital collection system of the 
herbarium. Users can quickly record the information on mobile phone in the wild and then apply 
these data to specimen digitization. This new method improves the efficiency and accuracy of all 
steps: from the collecting event to specimen curation. More importantly, this method can link field 
photos with specimen data naturally, which means that the color, behavior, three-dimensional 


structure, environment and other information that the traditional specimens are difficult to display 


基金 项 目 ， 云 南 省 重大 科技 专项 计划 -电子 信息 与 新 一 代 信息 技术 重大 专项 〈2018ZI001-3) ;中国 科学 院 
战略 性 先导 科技 专项 (A 类 ) 地 球 大 数据 地 球 大 数据 科学 工程 (XDA19050202) ; 中 国 科 学 院 战 略 生 物资 
源 计划 (KFJ-BRP-017-13); 云南 省 基础 研究 专项 (202101AS070032 [Supported by Yunnan Key Science And 


Technology Special Projects-New Generation of Information Technology (2018ZI001-3); Strategic Priority 
Research Program of the Chinese Academy of Sciences (XDA19050202); Biological Resources Programme, 
Chinese Academy of Sciences (KFJ-BRP-017-13); Yunnan Fundamental Research Projects (202101A5070032)] 。 
作者 简介 : 徐 洲 锋 (1989 - )， 硕 士 ， 助 理工 程 师 ， 研 究 方向 为 生物 多 样 性 信息 学 和 生物 地 理学 ，〈E-mail) 
xuzhoufeng  mail.kib.ac.cn 。 


* 通 信 作 者 : 陈 家 辉 ， 博 士 ， 研 究 员 ， 研 究 方向 为 植物 系统 演化 及 生物 多 样 性 信息 学 ， (E-mail) 
chenjh@mail.kib.ac.cn 。 


now can be presented to the researchers. This not only expands the value of traditional specimens, 
but also hopes to extend the time and space of specimen identification and discussion in the future. 
In addition, the potential of citizen science in solving the problem of herbarium also provides a 
new perspective for us to redefine the scientific value of herbarium. 
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标本 数字 化 支持 了 诸如 GBIF Chttp//www.gbif.org/) , NSH Chttp://www.nsii.org.cn/) ， 

iDigBio (https://www.idigbio.org/) 等 全 球 和 国家 尺度 的 生物 多 样 性 信息 平台 以 及 各 类 标本 馆 
和 区 域 尺度 的 标本 数据 库 建 设 。 这 些 富 集 的 数据 结合 涌现 的 新 技术 (尤其 是 信息 技术 和 测序 
技术 ) 进 一 步 促 进 了 各 类 新 应 用 、 新 研究 的 快速 发 展 (Soltis, 2017; Morrison et al., 2017; Willis 

et al., 2017; James et al., 2018) ， 并 为 我 们 在 时 空 尺度 上 探究 生物 之 间 的 宏观 联系 及 其 微观 
机 理 带 来 了 全 新 的 视角 和 模式 。 同时, 标本 的 数字 化 也 促进 和 支持 了 生物 多 样 性 信息 学 这 门 
新 兴学 科 的 诞生 和 发 展 ( 王 利 松 等 , 2010) 并 使 其 在 全 球 、 地 区 和 国家 尺度 的 标本 数据 整合 、 

共享 与 利用 等 方面 发 挥 出 了 中 流 碟 柱 的 作用 。 
然而 ， 相 比 迅速 发 展 的 标本 数据 整合 与 分 享 ， 标 本 馆 收集 标本 的 方式 和 流程 却 鲜 有 变 

> 化 (Schindel & Cook, 2018) . 虽然 目 前 也 有 一 些 现代 的 技术 和 方法 被 采用 , 比如 使 用 GPS 记 

-一 录 地 理 坐 标 与 海拔 、 使 用 条 形 码 标识 标本 、 采 用 数据 库 管 理 标本 ， 将 分 子 材料 纳入 采集 保藏 

职能 等 ， 但 是 标本 收集 流程 中 固有 的 缺陷 却 仍然 未 能 得 到 有 效 地 解决 (Daru et al., 2017; 徐 
洲 锋 ，2018) ， 这 包括 : (1) 许多 标本 的 信息 不 完整 ， 导 致 标本 价值 受 限 (比如 采集 人 、 
采集 时 间 、 采 集 地 点 等 关键 信息 的 缺失 ) ; (2) 不 同 来 源 的 标本 ， 数 据 差 异 较 大 ， 致 使 数 
据 整 合 困难 ; G) 一 些 宏观 信息 难以 在 标本 中 得 到 准确 保存 〈 比 如 花 的 颜色 、 分 枝 的 角度 
SE) ; CAD 各 种 原因 造成 的 数据 偏差 〈 比 如 错误 的 日 期 、 坐 标 值 和 拉丁 名 拼写 ) ; C50 x 

复 且 低 效 的 标本 数据 转录 ; (60 缓慢 的 标本 鉴定 与 讨论 。 针 对 这 些 缺 陷 ， 也 有 一 些 解决 方 
2 案 ， 比 如 尽 可 能 地 标准 化 传统 标本 收集 流程 的 各 个 环节 ; 开发 定制 化 的 标本 数字 化 系统 
Ee (Gries et al., 2014) ; 采用 新 设备 和 新 技术 生产 数字 标本 (Blagoderov 2012; Drinkwater et al., 
,一 2014) 。 这 些 工 作 确实 可 以 从 各 个 环节 提升 标本 收集 的 效率 和 品质 ， 但 其 本 质 上 仍然 属于 对 

^ 传统 标本 收集 流程 的 优化 ， 因 此 很 难 从 体系 上 彻底 解决 上 述 问题 。 

当然 ， 这 并 不 意味 着 原 有 的 标本 收集 流程 是 错误 的 。 事 实 上 它 至 今 仍然 能 够 很 好 地 满 

'e 足 传 统 分 类 学 的 需要 。 只 是 由 于 学 科 的 发 展 ， 新 的 研究 方法 和 研究 内 容 对 标本 资源 ， 特 别 是 

FL 对 标本 的 数字 化 资源 提出 了 新 的 要 求 ， 比 如 需要 更 精准 的 位 置信 息 、 能 够 很 好 地 执行 数据 聚 

合 、 需 要 稳定 持久 的 标识 、 便 于 分 享 与 利用 等 〈Vissers et al., 2017; Hobern et al., 2019) ， 而 

原 有 的 模式 却 很 难 适应 这 些 新 的 需求 。 通 过 公众 科学 解决 这 些 问题 是 目前 国际 研究 的 趋势 ， 

比如 让 博物 馆 ( 标 本 馆 〉 支 持 业 余 科 学 家 的 成 长 和 发 展 ， 招 募 志愿 者 参与 博物 馆 ( 标 本 馆 ) 

的 野外 调查 ， 通 过 众 包 转 录 和 审核 数字 标本 (Sforzi et ab, 2018) 。 这 些 尝试 很 大 程度 上 展 

示 出 了 公众 科学 在 博物 馆 生物 多 样 性 研究 中 的 巨大 潜质 。 然 而 这 些 工作 之 间 尚 未 构成 体系 ， 

因此 还 不 能 从 整体 上 重 塑 标本 的 收集 流程 。 对 此 ， 本 文 基于 Biotracks 公众 科学 平台 构建 并 

实践 了 一 种 新 型 的 标本 收集 模式 , 该 模式 可 以 提高 植物 标本 收集 的 效率 和 品质 , 并 有 望 系统 

地 解决 传统 标本 馆 收 集 流程 中 的 诸多 缺陷 。 同 时 结合 Biotracks， 本 文 还 简要 阐述 了 根植 于 

公众 发 展 标本 馆 的 必要 性 , 以 及 标本 馆 应 用 公众 科学 的 一 些 思路 , 以 期 为 国内 同行 抛砖引玉 。 


1 材料 与 方法 


1.1 Biotracks 客户 端 简介 
Biotracks 是 由 中 国 科 学 院 昆 明 植 物 研 究 所 开发 的 一 款 开放 免费 的 自然 观察 类 公众 科学 
应 用 ， 该 应 用 可 以 帮助 用 户 组 织 自 然 观 察 项 目 ， 记 录 户 外 生物 物种 信息 。Biotracks 目前 拥 


c 
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有 WEB 端 ( http:/www.biotracks.cn ) 、Android 版 和 IOS 版 (下载 地 址 : 
http://www.biotracks.cn/app/biotracks， 也 可 在 各 类 国产 手机 应 
察 ” 下 载 安装 ) ， 同 时 微 信 小 程序 版 也 将 于 2021 年 6 月 份 正 式 上 线 。 本 研究 中 ， 我 们 使 用 


X 


| 市场 自行 搜索 中 文 名 “生命 观 


Biotracks 手机 客户 端 记录 标本 的 采集 信息 ， 使 用 Biotracks WEB 端 进行 数据 的 管理 和 下 


载 。 为 了 保 记 


E APP 能 够 彻底 地 替代 纸 媒 或 电子 表格 记录 ，Biotracks 手机 客户 端 专门 为 杆 


物 标 本 的 采集 记录 做 了 以 下 一 些 适 配 和 优化 。 

1.1.1 定制 专用 记录 模版 ”Biotracks 能 够 为 不 同类 型 的 任务 定制 专属 的 数据 记录 模版 〈 比 如 
鸟 类 观察 、 植 被 样 方 / 样 线 调 查 等 ) ， 我 们 根据 标本 采集 记录 的 需要 ， 专 门 拟 定 了 相应 的 数 
据 标 准 〈 详 见 下 一 节 ) ， 并 以 此 制定 了 Biotracks 的 标本 采集 记录 模版 。 

1.1.2 自动 记录 关键 信息 “APP 能 够 自动 记录 观察 对 象 的 地 理 坐 标 、 海 拔 、 发 现时 间 、 记 录 


编号 等 信息 ， 


tH 


理 坐 标 解析 获得 结构 化 的 地 址 信息 。 
1.1.3 快速 录入 物种 学 名 通过 网 络 ，APP 用 户 可 以 使 用 中 文 俗 名 、 俗 名 拼音 、 拉 丁 名 等 字 


且 这 一 过 程 并 不 需要 网 络 的 支持 。 同 时 ，APP 在 有 网 络 状态 下 还 可 以 利用 地 


符 检 索 到 逾 百 万 条 的 全 球 植物 、 菌 物 、 鸟 类 、 鱼 类 以 及 中 国 两 栖 、 扑 行 和 哺乳 动物 的 拉丁 名 


以 供 使 用 ; 而 在 无 网 络 环境 下 ， 用户 也 可 以 通过 APP 内 置 的 十 万 多 条 中 国生 物 物种 名 称 库 
检索 所 需要 的 拉丁 名 ， 以 满足 国内 大 多 数 离线 场景 下 的 学 名 录入 需求 。 
1.1.4 支持 AI 辅助 鉴定 APP 的 人 工 智能 图 像 识别 引擎 会 尝试 识别 所 拍摄 的 物种 照片 ， 并 
推荐 可 能 的 拉丁 名 以 供用 户 参 考 使 用 。 


1.1.5 高 效 的 人 机 交互 ”为 了 保证 手机 操作 的 便捷 性 ，Biotracks APP. 的 记录 界面 做 了 大 量 的 
人 机 交互 优化 ， 这 包括 : (1) 界 面 中 每 个 字段 所 处 的 位 置 都 会 被 仔细 考量 ， 以 尽 可 能 降低 信 


息 录入 时 手指 划 动 的 范围 (比如 通常 情况 下 APP 会 自动 写 入 海拔 、 地 理 坐 标 等 信息 ， 这 些 


无 需 人 工 录 入 的 字段 就 会 被 放置 在 录入 界面 的 后 部 ， 以 减少 干扰 ); (2) 不 同 的 字段 会 选择 


不 同 的 录入 方式 ,不 同 字段 的 内 容 录 入 还 会 辅 以 不 同 的 快捷 键 ， 以 尽 可 能 简化 录入 操作 〈 比 
如 有 些 字段 会 采用 下 拉 选 项 写 入 文本 ， 有 些 字段 会 直接 调用 数字 键盘 键入 数字 , 而 有 些 字段 
则 可 以 直接 通过 “复制 ”快捷 键 复制 上 一 条 记录 的 内 容 ) ; (3) 对 于 一 些 内 容 比 较 稳 定 的 字 


Bt, APP 会 自动 复 用 上 一 条 记录 的 内 容 ， 以 减少 人 工 操作 《比如 同一 次 采集 活动 中 ， 采 旨 


(E 


人 员 的 姓名 大 部 分 情况 下 是 不 会 改变 的 , 记录 模版 会 自动 将 上 一 条 记录 的 采集 人 员 信 息 写 入 


下 一 条 记录 ) 


o 


1.1.6 数据 安全 的 保障 为 了 防止 因 用 户 手 机 丢失 、 损 坏 、 更 换 导 致 的 数据 遗失 。 手 机 APP id 


录 的 所 有 数据 都 可 以 在 有 网 络 的 情况 下 上 传 至 Biotracks 云端 。 用 户 可 以 通过 个 人 账户 登陆 
biotracks.cn 访问 、 编 辑 、 下 载 这 些 数 据 。 而 如 果 用 户 更 换 了 手机 ， 云 端的 数据 也 会 加 载 到 
新 手机 的 APP 之 中 。 
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图 1 Biotracks 官方 网 站 biotracks.cn 首页 


Fig.1 The homepage of biotracks.cn 


1.2 数据 标准 
Biotracks 可 以 根据 不 同 的 任务 需求 定 
DarwinCore (http://rs.tdwg.org/dwc/) 定义 了 


央 相 应 的 数据 模板 。 对 于 标本 采集 ， 我 们 遵循 
14 个 核心 字段 GRE 1) 。 显 然 这 14 个 字段 并 


不 能 覆盖 完整 的 标本 记录 信息 《比如 缺少 行政 区 划 、 鉴 定 人 、 鉴 定时 间 、 科 、 属 等 等 ) ， 但 


其 他 必要 的 信息 一 般 都 可 以 根据 这 些 字段 的 值 以 及 用 户 的 ID 由 Biotracks 自动 推断 生成 和 


补充 。 这 样 的 设计 可 以 让 用 户 录入 最 少 的 内 容 ， 实 现 最 大 的 信息 完整 性 。 同 时 ， 基 于 这 些 核 
心 字段 , 我 们 还 为 不 同 分 类 群 分 别 定义 了 一 套 性 状 描述 属性 ,这些 属 性 , 会 被 定义 为 一 种 形 
似 字段 的 数据 库 虚 拟 列 (https://dev.mysql.com/doc/reftman/5.7/en/json.html)， 并 以 JSON 对 象 


的 形式 存储 在 dynamicProperties 核心 字段 下 。 对 于 用 户 而 言 这 些 属性 与 其 他 字段 无 异 ， 但 
却 能 极 大 地 简化 和 统一 不 同类 群 的 数据 模版 设计 ， 并 提高 应 用 适 配 的 灵活 性 。 


借助 以 上 方案 ，Biotracks 不 仅 大 幅 减少 了 人 工 记 录 的 内 容 、 降 低 了 用 户 界面 (User 


Interface, UT) 的 复杂 度 ， 还 统一 了 各 个 类 群 的 数据 记录 标准 ， 从 而 为 标本 数据 的 跨 类 和 群 、 跨 


平台 整合 提供 了 良好 的 基础 。 本 研究 主要 针对 植物 标本 的 采集 , 因此 使 用 植物 相关 的 模版 进 


行 数据 的 记录 。 
表 1 Biotracks 标本 记录 


项 目 定义 的 14 个 核心 字段 


Table 1 14 core fields in specimens collection project of Biotracks 


字段 名 称 中 文 名 对 照 示例 

Field name Chinese name Example 

category 大 类 别 Pteridophyta 

recordedBy 采集 人 HAH, RINE 

recordNumber 采集 号 9170 

eventDate 采集 时 间 2018-12-12 13:33:04 

locality 小 地 点 松林 沟 

decimalLatitude 纬度 46.9833486 

decimalLongitude 经 度 85.9428474 

minimumElevationInMeters 海拔 《〈 低 值 ) 1 816 

maximumElevationInMeters 海拔 (高 值 ) 1 840 

habitat 生活 环境 多 石山 坡 灌 从 

occurrenceRemarks 采集 备注 当地 药 用 

dynamicProperties 动态 属性 JSON 对 象 ， 属 性 可 依据 类 群 不 同 而 不 同 ， 比 
如 对 于 种 子 植 物 ， 它 包含 了 : i SE. "FS dE. 
果 、 种 子 、 胸 径 、 体 高 、 频 度 等 扩展 属性 。 

associatedMedia 关联 媒体 http://cloudfile.biotracks.cn/userimg/28/2019-08- 
16/74498871565930525.jpg!740 

scientificName 学 名 Cystopteris fragilis 


actual needs. 


1.3 数据 采集 


注 : 除了 category 是 根据 需要 自行 扩展 获得 ， 其 他 字段 名 均 来 源 于 Darwin Core 标准 。 


Note: Most fields are named according to the Darwin Core Standard, except for ‘category’ is obtained according to 
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使 用 Biotracks 执行 标本 采集 信息 的 记录 ， 需 要 首先 在 手机 APP 上 建立 一 个 标本 采集 项 
， 这 个 项 目 可 以 是 公开 的 《公共 项 目 ， 所 有 用 户 可 见 可 加 入 ) 、 


目 


L1 
ZN 


有 创建 者 才能 邀请 人 员 加 入 ) 或 者 私密 的 《私人 项 目 ， 


部 分 可 见 的 《团队 项 目 ， 


只 有 创建 者 可 以 使 用 ) 。 加 入 项 


目的 成 员 会 使 用 一 致 的 数据 模版 记录 标本 采集 信息 。 采集 标本 时 , 记录 者 需要 首先 预 设 第 一 


条 记录 的 采集 人 、 采集 号 样式 及 其 起 始 序 号 等 通用 信息 。 
需要 复 用 的 信息 , 并 能 依据 预 设 的 编号 按 序 编排 采集 号 。 当 
APP 会 默认 写 入 当前 的 海拔 、 经 纬度 和 时 间 信 息 ， 用 户 也 可 以 手动 编辑 这 些 信息 ， 或 
者 通过 所 拍摄 的 现场 照片 重 置 这 些 信息 〈 若 照片 有 GPS 坐标 ， 用 户 可 以 使 用 照片 的 GPS 4 
“ 标 数值 ， 这 对 于 后 补 采集 记录 非常 有 用 ) 。 
信息 直接 绑 定 ， 同 时 AI 引擎 还 会 识别 所 拍摄 的 照片 ， 并 给 出 物种 的 鉴定 参考 ， 用 户 可 以 
直接 使 用 或 修改 机 器 推荐 的 鉴定 。( 使 用 Biotracks APP. 记录 标本 采 


时 ， 


标 窗 写 当前 


后 续 记 录 会 自动 写 入 上 一 条 记录 中 


— 


https://mp.weixin.qq.com/s/daQRSbAAO9sRXITSENfIOkQ) 。 
1.4 数据 的 编辑 与 整合 
标本 采集 活动 通常 会 由 多 人 或 多 个 队伍 组 成 ， 其 中 每 个 成 员 的 工作 必然 会 各 有 侧重 。 

比如 一 些 成 员 擅长 鉴定 ， 另 外 一 些 负责 摄影 ， 还 有 一 些 需要 负责 i 材料 的 处 理 与 标记 。 在 传统 
模式 下 , 这 种 零散 而 又 各 自 相关 的 工作 很 难 实现 跨 时 空 的 作业 配合 


据 更 是 相当 困难 。 通 过 Biotracks 的 项 目 协同 功能 则 可 有 效 二 


标本 采集 活动 中 , 采集 信息 的 整理 通常 会 是 一 个 相对 滞后 的 工作 , 而 Biotracks 则 可 以 将 项 


目 


的 协同 模式 ， 


记录 时 ， 手 机 拍摄 的 照片 会 与 采 旨 


j 户 在 标本 采集 的 现场 记录 信息 


m 


集 信 息 的 详细 说 明 请 见 : 


， 整合 这 些 工作 产生 的 数 


也 解决 决 这 一 问题 。 比 如 实际 的 


内 每 个 成 员 记 录 的 采集 信息 通过 网 络 汇总 到 云端 , 以 供 所 有 成 员 在 电脑 和 手机 端 浏 览 和 编 
辑 。 同 时 ， 一 些 成 员 作 出 的 鉴定 ， 也 可 以 通过 云端 传递 给 其 他 成 员 参 考 或 使 用 ， 而 每 个 成 员 
对 于 数据 的 编辑 和 补充 , 同样 也 会 及 时 反馈 到 云端 。i 


这 种 通过 信息 Pun 


< 享 连接 线 下 与 线 上 作业 


能 够 将 项 目 数据 的 最 新 状态 充分 整合 到 云端 并 同步 到 手机 APP 内 ， 从 而 让 原 


本 独立 、 分 散 的 个 体 工 作 ， 联 结 成 可 以 协作 互助 的 动态 网 络 。 


图 2 Biotracks 植物 标本 采集 信息 记录 界面 E) 


、 项 目 协同 内 的 


与 成 员 数 据 贡 献 排名 界 


E CB) 


£ T 
o- 
(5 


图 片 汇总 归 类 界面 (中 ) 


Fig.2 Plant collection information record interface (left), image classification and summary 
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interface (middle) and member data contribution ranking interface (right) in project collaboration 
of Biotracks 

1.5 连接 馆藏 数字 标本 

Biotracks 记录 的 采集 信息 可 以 被 导出 为 符合 Darwin Core (http://rs.tdwg.org/dwc/) 规 
范 的 Excel 数据 表 。 这 些 Excel 数据 表 既 可 以 被 用 于 纸 质 标签 的 打印 ， 也 可 以 被 导入 到 标 
本 馆 的 数据 库 中 作为 标本 数字 化 的 基础 资料 ， 以 避免 标签 信息 被 二 次 转录 。 此 外 ,数据 表 中 
的 associateMedia 字段 还 记录 了 标本 的 野外 照片 地 址 ， 标 本 数字 化 系统 可 以 借 此 实现 数字 
标本 和 标本 原生 照片 的 自然 整合 。 

标本 馆 的 数字 化 系统 需要 依据 Biotracks 采集 信息 的 数据 规范 做 一 些 技术 适 配 , 才 可 以 
导入 Biotracks 的 数据 表 。 考 虑 到 目前 国内 标本 馆 信息 化 建设 的 现状 , 我 们 专门 开发 了 一 套 
专业 的 数字 标本 馆 内 容 管 理 系 统 (Content Management System, CMS) : Kingdonia 数字 标本 
馆 系 统 〈 徐 洲 锋 ，2018) 。 该 系统 高 度 适 配 了 Biotracks 的 数据 标准 和 接口 协议 ， 不 仅 可 以 
导入 Biotracks 数据 表 ， 还 可 以 通过 Biotracks 授权 的 接口 检索 和 获取 相应 的 采集 记录 (图 
3) ， 这 样 即 便 标 本 馆 在 接收 标本 时 没有 获得 相应 的 电子 数据 ， 也 可 以 调用 存储 在 Biotracks 
中 的 采集 信息 以 提升 标本 数字 化 的 效率 。 此 外 ，Kingdonia 系统 还 支持 独立 部 署 和 管理 ， 系 
统 能 够 在 线 获 得 升级 ,并 可 以 根据 不 同 标本 馆 的 馆藏 类 群 和 作业 模式 进行 定制 开发 , 因此 可 
以 被 用 于 对 数据 的 权 属 以 及 管理 都 有 较 高 要 求 的 标本 馆 〈 博 物 馆 ) 。 


T 


iti 


图 3 Kingdonia 可 以 调用 Biotracks 记录 的 采集 信息 
Fig.3 Kingdonia can call the collection information recorded by Biotracks 

1.6 效率 评估 

Kingdonia 系统 支持 多 种 标本 数字 化 模式 , 工人 既 可 以 按照 传统 方式 对 照 标 本 标签 转录 
数字 标本 ; 也 可 以 从 Biotracks 调 取 数据 以 用 于 数字 标本 的 转录 。 为 了 评估 这 两 种 模式 的 转 
录 效 率 差 异 ， 我 们 从 Kingdonia 系统 中 导出 了 昆明 植物 研究 所 标本 馆 (KUN) 两 位 工人 的 
标本 转录 日 志 , 该 日 志 记录 了 每 一 份 标本 开始 转录 和 结束 转录 的 时 间 , 因此 可 以 被 用 于 标本 
转录 效率 的 量化 分 析 。 

不 同 标本 的 转录 效率 是 不 一 致 的 , 为 了 减少 标本 因素 的 影响 , 我 们 尽 可 能 提取 两 位 工人 
相 邻 时 间 的 转录 日 志 ， 以 确保 不 同 工 人 转录 的 标本 ， 其 性 质 尽 可 能 接近 。 每 位 工人 的 日 志 又 
会 被 分 为 人 工 转录 的 标本 A 类 样本 ) 和 调用 Biotracks 数据 转录 的 标本 (OI 类 样本 ) ， 最 
终 根据 人 员 不 同 总 共 可 获得 A-I、A-I、B-I、B-I 四 组 样本 CA. B 指 代 不 同 的 工人 ) 。 每 
组 样本 都 可 以 根据 标本 的 开始 转录 时 间 和 结束 转录 时 间 计 算出 每 份 标本 的 转录 时 长 , 由 于 这 
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些 标 本 都 是 在 日 常 工作 中 被 自然 转录 ,因此 会 存在 一 些 转 录 时 长 明显 脱离 实际 的 标本 (比如 
工人 在 转录 的 中 途 开 始 休息 ,或 者 临时 有 事 打 断 了 原 有 的 转录 工作 都 可 以 造成 标本 转录 时 间 
被 延长 ) 。 根 据 经 验 ， 我 们 将 各 组 中 转录 耗 时 最 长 的 前 10% 的 标本 作为 无 效 值 排除 ， 剩 下 
的 标本 作为 可 评估 样本 参与 量化 分 析 。 
对 于 可 评估 样本 , 需要 计算 出 每 组 样本 中 标本 转录 时 长 的 中 位 数 、 上 下 四 分 位 数 、 上 限 、 
下 限 \ 平 均值 , 其 中 上 限 采 用 上 四 分 位 数 加 1.5 倍 四 分 位 距 获 得 , 下限 采 用 下 四 分 位 数 减 1.5 
倍 四 分 位 距 获 得 。 然 后 对 每 组 样本 做 箱 体 图 进行 比较 分 析 。 
2 结果 与 分 析 
2.1 Biotracks 在 植物 标本 采集 活动 中 的 推广 效果 
Biotracks 的 构想 始 于 2013 年 ,并 于 2014 年 底 与 Kingdonia 系统 同步 开始 实施 。 整 个 
平台 于 2016 年 9 月 对 外 正式 上 线 了 首 个 WEB 端 
Chttp://www.kib.cas.cn/xwzx/zhxw/201609/t20160907_4659604.html) , F 2017 年 9 月 发 布 
了 首 个 手机 版 本 (http://www.kib.cas.cn/xwzx/zhxw/201709/t20170901_4854058.html〉。 后 经 
若干 年 的 发 展 ， 目 前 Biotracks 共有 注册 用 户 16 987 名 ,这 些 用 户 总 共 记 录 了 200 ZAIK 
的 物种 照片 、60 万 条 的 物种 观察 记录 ， 其 中 近 23 万 条 为 植物 标本 的 采集 记录 ， 有 关 
Biotracks 的 用 户 、 物 种 观察 记录 、 图 片 、 植 物 标 本 采集 记录 的 增长 趋势 请 见 图 4。 
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图 4 2016 9 HÆ 2021 年 3 月 ，Biotracks 标本 采集 记录 (左上 ) 、 图 片 数 量 CR EO 、 
注册 用 户 ( 右 下 )〉 、 物 种 观察 记录 (左下 ) 增长 折线 图 


Fig.4 Growth line chart of collection record (upper left), photos number (upper right), users (lower 


right), occurrence record (lower left) from September 2016 to March 2021 on Biotracks 


对 Biotracks 的 用 户 群 体 进 行 分 机， 可 以 发 现 与 标本 馆 直接 相关 的 用 户 中 ， 比 较 有 代表 
性 的 群体 主要 来 自 于 中 国 科学 院 。 其 中 表 2 罗列 出 了 目前 用 户 最 多 的 前 15 个 中 国 科 学 院 
下 属 机 构 , 可 以 看 出 主要 是 一 些 与 动 植物 相关 的 研究 所 和 植物 园 。 这 些 机 构 内 的 植物 标本 馆 
不 仅 各 其 区 域 特色 , 其 馆藏 标本 的 总 量 甚至 占据 了 中 国 过 半 的 植物 标本 储量 ( 资 鹏 等 ,2021 )。 
Biotracks 目前 也 被 这 些 单位 中 的 昆明 植物 研究 所 标本 馆 (KUN) 、 华 南 植物 园 标 本 馆 
(IBSC〉、 西 双 版 纳 热带 植物 园 标本 馆 (HITBC) 、 成 都 生物 研究 所 标本 馆 CCDBD 、 新 
疆 生 态 与 地 理 研究 所 标本 馆 CXIJBD 、 南 京 中 山 植物 园 标 本 馆 NAS 等 标本 馆 所 采用 ， 
他 们 不 仅 将 Biotracks 应 用 到 了 日 常 的 标本 采集 活动 中 ， 还 将 Kingdonia 数字 标本 馆 系统 
引入 到 馆藏 标本 的 管理 之 中 ， 从 而 形成 了 完整 的 应 用 体系 
(http://www.kib.ac.cn/xwzx/zhxw/201912/t20191231_5479319.html》。 

表 2 中 国 科 学 院 下 属 单位 与 中 国 高 等 院 校 中 用 户 数 量 最 多 的 15 个 机 构 


Table 2 15 CAS institutions and universities with the largest number of users 


机 构 用 户 数量 ”机 构 I Æ 
Institution No. of users Institution No. of users 
中 国 科 学 院 昆 明 植物 研究 所 浙江 大 学 
Kunming Institute of Botany, CAS 307 Zhejiang University 725 
中 国 科学 院 西双版纳 热带 植物 园 武汉 大 学 
Xishuangbanna Tropical Botanical Garden, CAS 126 Wuhan University 367 
- 中 国 科学 院 华南 植物 园 Bii cn 
South China Botanical Garden, CAS 72 Gannan Normal University 285 
= 中 国 科学 院 植物 研究 所 淮北 师范 大 学 
9 a Institute of Botany, CAS 66 Huaibei Normal University 217 
CC 江苏 省 中 国 科学 院 植物 研究 所 福建 农林 大 学 
í Institute of Botany, Jiangsu Province, CAS 43 Fujian A & F University 215 
中 国 科 学 院 新 疆 生 态 与 地 理 研 究 所 


Xinjiang Institute of Ecology and Geography, 安徽 农业 大 学 

CAS 40 Anhui Agricultural University 201 

中 国 科 学 院 武汉 植物 园 华南 农业 大 学 

Wuhan Botanical Garden, CAS 34 South China Agricultural University 193 
贵州 中 医院 大 学 

中 国 科学 院 上 海 辰 山 植物 园 Guizhou University of Traditional 

Shanghai Chenshan Botanical Garden 34 Chinese Medicine 188 

中 国 科 学 院 成 都 生物 研究 所 南大 等 

Chendu Institute of Biology, CAS 33 Southwest University 170 

中 国 科学 院 庐山 植物 园 lr s 


Lushan Botanical Garden, CAS 21 Shanxi University 164 


中 国 科学 院 昆明 动物 研究 所 宁夏 大 学 
Kunming Institute of Zoology, CAS 20 Ningxia University 

中 国 科 学 院 西 北 高 原生 物 研究 所 吉首 大 学 

Northwest Institute of Plateau, CAS 12 Jishou University 

中 国 科学 院 沈阳 应 用 生态 研究 所 南京 师范 大 学 

Institute of Applied Ecology, CAS 12 Nanjing Normal University 
中 国 科 学 院 动物 研究 所 兰州 大 学 

Institute of Zoology, CAS 11 Lanzhou University 

中 国 科 学 院 东 北 地 理 与 农业 生态 研究 所 


126 


124 


112 


101 


100 


Northeast Institute of Geography and 6 北 农林 科技 大 学 
Agroecology, CAS 10 Northwest A & F University 
注 : 用 户 所 属 机 构 为 用 户 注 册 账 户 时 自行 提交 的 文本 ， 一 些 机 构 会 有 很 多 别称 ， 这 里 提供 的 仅 是 根据 机 构 


标准 称谓 聚 类 获得 的 数据 。 


have many nicknames. The data provided here is only based on the standard name of the institution. 


Note: The institution name is the text submitted by users when they register their accounts. Some institutions will 


除 此 之 外 , 高 校 则 是 Biotracks 目前 用 户 群体 中 最 大 的 单一 来 源 。 Biotracks 有 超过 100 


多 所 高 校 的 用 户 〈 表 2 列 出 了 用 户 最 多 的 15 所 高 等 院 校 ) ， 这 些 用 户 既 使 用 B 
行 野外 科 考 , 也 会 使 用 Biotracks 引导 学 生 进 行 标本 的 采集 和 物种 的 观察 记录 , B 
项 目 统计 则 可 以 将 每 个 学 生 的 实际 贡献 反馈 给 老师 作为 评估 实习 效果 的 参考 。 


iotracks 进 
iotracks 的 


而 在 实际 应 用 中 ，Biotracks 的 标本 采集 项 目 可 涉及 生物 多 样 性 调查 的 方 方 


HI IH] ， 


列 出 了 一 些 具有 代表 性 的 标本 采集 项 目 , 这 些 项 目 涉及 自然 保护 区 的 本 底 资源 调查 、 各 种 


F 


XI o 


RRKREKWEWEEEmEH, PiíEIETVIZSERU UI SI. WARE E RRR, P 
普查 等 等 。 此 外 ， 第 二 次 青藏 高 原 科学 考察 .植物 多 样 性 的 调查 还 将 Biotracks 作为 植物 标 
本 采集 的 推荐 应 用 进行 了 推广 。 应 该 说 ，Biotracks 在 国内 植物 标本 的 采集 活动 中 ， 目 前 已 


经 被 领域 广泛 接纳 和 使 用 。 
表 3 Biotracks 上 一 些 具 有 代表 性 的 标本 采集 项 目 


Table 3 Some typical specimen collection projects of Biotracks 


项 目 名 称 采集 号 数 


Project name No. 


of collection 


贵 大 -贵州 省 菌 物资 源 普 查 及 创新 利用 


Guizhou University - General Survey and Innovative Utilization of Fungi Resources in Guizhou 


Province 9 729 
2020 年 度 地 衣 二 次 科 考 

Scientific Investigation of Lichen - QTP2020 4 520 
Anl ul d Fr Cer 8 dx 

A Survey of Bryophytes in Eastern Dabie Mountains 1 041 
蕨 类 采集 (省 ) 

Fern Collection by Wang 1 946 
青海 南 -川西 高 山 冰 缘 带 植物 科 考 3750 
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Scientific Investigation of Plants in Alpine Periglacial Zone of Southern Qinghai and Eastern 


Sichuan 


西藏 科 考 


Scientific Investigation of Xizang Province 


大 别 山 维 管 植物 


Vascular Plants in Dabie Mountains 


梵 净 山水 青冈 采集 
Fagus longipetiolata Collection in Fanjin Mountain 
世界 科 级 植物 采集 
Collection of World Family Plants 


豆 -Legume Project 

Fabaceae-Legume Project 

冬青 采样 

Ilex Sampling 

棕榈 科 条 形 码 研 究 

Barcoding Research of Arecaceae 
HITBC 标本 联盟 

Specimen Alliance of HITBC 

种 质 库 采 集 部 

Collection Department of GBOWS 
西双版纳 国家 级 自然 保护 区 本 底 调 查 
Background Survey of Xishuangbanna National Nature Reserve 
QTP 天 山 帕 米尔 科 考 分 队 2020 

Tianshan Pamirs Scientific Expedition - QTP2020 


藏 东南 植物 调查 


Plant Survery in Southeast Xizang Province 


高 黎贡山 - 怕 罗 雪山 植物 多 样 性 调查 
Plant Diversity Survey of Gaoligong - Biluo Snow Mountain 
李 攀 的 采集 记录 

Collection Record of Li Pan 

深圳 植被 空间 分 布 

Spatial Distribution of Plants in Shenzhen 


专 类 园 引种 


Introduction of Specialized Garden 


mt 


E 


肯尼亚 植物 志 -2019.1 中 肯 联 合 科 考 


Flora of Kenya - Sino Kenya Joint Scientific Survery 
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312 
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616 


314 


4729 


1475 


3 049 


1 344 


1 091 


852 


797 


599 


481 
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乌 蒙 山 植物 植被 监测 -凭证 标本 采集 
Vegetation Monitoring in Wumeng Mountains - Voucher Specimen Collection 285 
西峰 药 用 植物 普查 
General Survey of Medicinal Plant in Xifeng Mountain 234 
干 岛 湖 植 物 学 野外 实习 
Field Practice of Botany in Qiandao Lake 911 
植物 标本 采集 与 鉴定 培训 班 
Plant Specimen Collection and Identification Training Class 156 
明光 万 栽培 植物 采集 
Collection of Cultivated Plants by Hu Guangwan 246 
马达 加 斯 加 考察 
Scientific Expedition to Madagascar 176 
动 康 口岸 外 来 入 侵 植物 调查 
Investigation on Invasive Plants at Mengkang Port 167 
浦江 县 野菜 野 果 资源 调查 
Investigation on Wild Vegetable and Fruit Resources in Pujiang County 165 


2.2 植物 标本 的 数字 化 

我 们 通过 对 Kingdonia 系统 的 日 志文 件 进行 分 析 , 获得 了 图 5 所 示 的 昆明 植物 研究 所 
标本 馆 (KUN) 两 位 工人 的 标本 转录 效率 箱 体 图 。 通 过 箱 体 图 ， 可 以 发 现 相 对 于 人 工 转录 ， 
调用 Biotracks 数据 转录 标本 显示 出 了 以 下 三 个 优势 。 
2.2.1 标本 转录 的 效率 明显 更 高 A.B 工人 转录 I 类 样本 的 平均 时 长 分 别 为 336 和 389 s, 
A. B 工人 转录 II 类 样本 的 平均 时 长 分 别 为 117 和 124s. A, B 工人 在 Il 类 样本 中 ， 标 
本 的 平均 转录 时 长 都 明显 低 于 I 类 标本 ， 两 个 工人 都 有 近 三 倍 的 转录 效率 提升 。 
2.2.2 工人 的 表现 更 加 稳定 A B 工人 转录 I 类 样本 的 上 下 限 分 布 范围 明显 更 大 ， 四 分 位 
距 也 更 长 ， 中 位 数 与 平均 值 的 偏差 相对 更 大 ， 说 明 工 人 在 转录 I 类 样本 时 ， 表 现 并 不 稳定 ， 
有 些 标 本 需要 耗费 较 长 的 时 间 才 能 完成 转录 ， 有 些 则 可 以 很 快 地 完成 转录 ; 而 A、B 工人 在 
转录 Hn 类 样本 时 ， 其 转录 时 长 的 波动 范围 要 显著 小 于 工 类 样本 。 这 个 结果 其 实 可 以 预见 。 
人 工 转 录 标 本 所 需要 的 时 长 ,往往 是 和 标本 标签 上 的 内 容 多 少 、 字 迹 辨识 的 难 易 程 度 直接 相 
关 ， 因 此 单 份 标本 的 转录 时 长 会 有 很 大 的 差异 ， 而 调用 Biotracks 数据 转录 标本 ， 绝 大 部 分 
的 标签 内 容 并 不 需要 人 工 转录 , 因此 受 标 签 内 容 性 质 的 影响 较 小 , 个 人 转录 效率 的 波动 自然 
更 小 。 
2.2.3 不 同 工 人 之 间 的 转录 效率 差异 更 小 A. B LAGE I 类 样本 的 平均 时 长 为 336 和 
389 s， 时 差 为 53s; A. B 工人 转录 II 类 样本 的 平均 时 长 分 别 为 117 和 124 s， 时 差 为 7 
s; 显然 在 处 理 ID 类 样本 时 ，A、B 两 位 工人 之 间 的 耗 时 差异 不 如 I 类 样本 显著 。 究 其 原 
因 ， 可 能 是 因为 对 于 HD 类 样本 ， 工 人 大 多 数 时 间 只 是 在 核对 所 调用 的 数据 与 标签 内 容 是 
一 致 ， 而 不 用 对 照 标本 标签 亲自 转录 文本 ,对 于 不 同 的 标签 内 容 , 单纯 的 核对 文本 内 容 可 能 
要 比 手工 转录 相应 的 内 容 更 为 简单 ， 由 此 使 得 不 同 工 人 之 间 的 转录 效率 差异 会 更 小 。 
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用 时 Time in seconds 


200 
100 
A-I A-II B-I B-II 
任务 组 Task group 


图 5 标本 转录 效率 对 比 图 


Fig.3 Comparison of specimen label transcription efficiency 


2.3 标本 信息 维度 的 扩展 

Biotracks 可 以 拍摄 标本 的 原生 照片 并 将 其 与 采集 信息 直接 绑 定 , 数据 同步 至 云端 之 后 ， 
照片 的 网 络 地 址 会 被 写 入 采集 信息 的 associatedMedia 字段 内 , 类 似 Kingdonia 这 样 的 数字 
标本 馆 系 统 在 调 取 Biotracks 的 采集 记录 时 ,就 可 以 将 这 些 照片 一 并 拉 取 并 与 相应 的 数字 标 
本 形成 关联 ， 从 而 使 得 传统 标本 原本 很 难 呈 现 的 颜色 、 行 为 、 立 体 结构 、 环 境 等 原生 信息 ， 
现在 都 可 以 通过 数字 标本 被 展现 在 研究 者 面前 (图 6) 。 


202108.00051 v1 


chinaXiv 


moi 自 汰 索引 


ChinaXiv 合 作 期 刊 


记录 工具 数据 集 专题 API 登录 im 


KUN:1495554 - Synotis cappa 


Q 


图 6 


实现 上 述 过 程 , 采集 者 和 标本 馆 并 不 需要 为 此 增加 额外 的 工作 量 。 但 在 传统 的 标本 采 旨 
流程 中 , 野外 照片 通常 会 被 每 个 采集 队员 保存 在 各 自 的 电脑 或 移动 硬盘 内 , 如 果 需 要 将 这 些 
照片 和 最 终 的 数字 标本 形成 关联 ,就 需要 耗费 大 量 的 人 力 和 时 间 用 于 照片 的 梳理 、 编 号 、 汇 
总 和 匹配 。 显然 这 些 工作 并 不 是 每 个 采集 者 都 可 以 做 到 , 更 多 的 时 候 这 些 照片 也 不 会 被 提交 


至 标本 馆 , 由 此 可 见 在 原 有 的 工作 流程 下 , 希望 依靠 人 力 去 完成 数据 的 关联 本 身 就 是 非常 困 


868136 
https-/noi.link/NOI:868136 (8 
馆藏 标本 
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http://www.kun.ac.cn/article/show/id/306 (8) 
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可 引用 «d 批量 引用 B sis 


noilink 网 站 上 的 KUN:1495554 号 数字 标本 ，https://noi.link/NOI:868136 


Fig.6 The digital specimen of KUN:1495554, https://noi.link/NOI:868136 


Mt 


难 的 。 而 Biotracks 确实 为 此 提供 了 一 种 实用 自然 的 方案 ， 可 以 有 效 解决 这 一 问题 。 
3 讨论 与 结论 


3.1 Biotracks 为 何 可 以 获得 广泛 应 用 ? 

针对 标本 的 采集 ， 在 Biotracks 正式 发 布 前 后 其 实 也 有 一 些 类 似 的 开放 应 用 出 现 ， 比 
如 collNotes、ColectoR 等 (Maya-Lastra, 2016; Powell et al., 2019) 。 然 而 这 些 应 用 却 没 有 像 
Biotracks 这 样 被 广泛 地 使 用 。 究 其 原因 ， 手 机 作为 一 种 新 的 记录 载体 ， 其 实 是 有 一 些 先 天 


劣势 ; 
不 展 影 


RE, 
A. 


(1) 屏幕 狭小 使 得 交互 空间 过 于 局 促 ， 进 而 会 对 浏览 和 编辑 信息 的 体验 和 效率 造成 


响 ; (2) 手机 体型 更 小 ， 虽 然 方便 携带 ， 但 也 更 容易 损坏 或 丢失 ， 从 而 影响 数据 安 
全 ; G) 智能 手机 续航 有 限 ， 自 身 电量 通常 难以 维持 长 时 间 的 户外 使 用 ;， (40. 相 较 于 纸 


智能 手机 的 操作 仍然 有 一 定 的 门槛 ， 因 此 并 不 是 所 有 人 都 会 接受 或 适应 这 一 记录 方 


这 些 缺 点 中 的 〈3) 和 (4) 可 以 通过 携带 移动 电源 和 加 强 用 户 培 训 予 以 改善 ， 因 此 最 
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终 真正 影响 用 户 是 否 选择 手机 记录 的 主要 因素 还 是 在 于 (1) (2) 所 述 的 便捷 性 和 安全 性 。 
而 这 两 点 恰好 是 软件 优化 能 够 予以 充分 解决 的 。 通过 自动 写 入 、 信息 复 用 、 交互 设计 、AI 辅 
助 、 字 段 最 小 化 等 多 种 措施 ，Biotracks 有 效 保障 了 手机 APP 记录 的 便捷 性 。 而 借助 网 络 
对 数据 进行 及 时 同步 则 可 以 最 大 限度 地 保障 数据 的 安全 性 。 

在 此 基础 上 ，Biotracks 还 有 纸 质 记录 或 电子 表格 难以 弥补 的 优势 ， 这 包括 : (1) 使 用 
Biotracks 不 仅 可 以 直接 生成 电子 数据 ， 还 可 以 不 依赖 于 网 络 和 其 他 外 置 设备 ， 写 入 准确 的 
拉丁 名 以 及 非常 精确 的 地 理 坐 标 、 海 拔高 度 、 观 测 时 间 等 信息 ; (20 智能 手机 能 够 直接 使 
用 移动 运营 商 提供 的 3G、4G、5G 等 网 络 服 务 ， 因 此 可 以 最 大 限度 地 利用 互联 网 增强 用 户 
在 户外 环境 中 的 信息 获取 能 力 ， 比 如 Biotracks 的 地 址 解析 、AI 鉴定 、 在 线 地 图 、 项 目 热 
力图 都 属于 网 络 服务 , 这些 服 务 不 仅 提高 了 记录 的 完整 性 ,还 增强 了 用 户 对 外 界 信息 的 实时 
感知 能 力 ， 进 而 能 够 提升 野外 采集 工作 的 品质 和 效率 ; G) 手机 非常 便携 ， 用 户 几 乎 随身 
携带 ， 这 使 得 互联 网 能 够 将 每 个 用 户 更 紧密 地 连接 起 来 ， 实 现 更 加 精细 的 分 工 协作 ; | (4) 
最 小 化 的 输入 和 标准 化 的 输出 ， 可 以 最 大 程度 地 保证 数据 的 规范 性 和 一 致 性 ， 由 Biotracks 
生成 的 数据 表 ， 字 段 歧 义 性 更 小 ， 值 和 结构 更 加 规范 ， 可 以 一 次 生成 ， 多 处 重用 ， 因 此 能 够 

大 幅 降 低 数据 整合 和 利用 的 难度 。 
~ 综 上 , Biotracks 不 仅 克 服 了 手机 记录 的 缺点 , 还 进一步 发 挥 出 了 手机 这 一 载体 的 优势 。 
使 用 Biotracks 进行 植物 标本 的 采集 ， 既 能 够 便捷 、 准 确 、 完 整地 记录 信息 ， 也 可 以 保证 
数据 的 规范 、 一 致 和 安全 ， 同 时 还 实现 了 更 加 精细 、 动 态 、 系 统 的 分 工 协作 ， 最 终 使 得 标 
本 的 采集 工作 更 为 省 时 、 省 力 、 省 心 。 
3.2 Biotracks 为 植物 标本 的 收集 建立 了 一 种 新 的 工作 流程 

除了 满足 一 线 工 作者 信息 记录 的 需求 ，Biotracks 还 能 够 深度 参与 从 采集 任务 规划 、 标 
本 采集 到 数据 的 整合 、 感 知 、 协 作 、 管 理 ， 乃 至 最 终 标本 的 数字 化 ， 这 一 整 条 标本 收集 流程 
中 各 个 环节 的 的 优化 和 重 塑 ( 图 7) 。 在 规划 采集 时 , 用 户 可 以 根据 实际 需要 , 建立 Biotracks 
虚拟 项 目 ， 不 同 采集 可 以 被 创建 为 不 同 的 项 目 ， 同 一 个 成 员 也 可 以 加 入 不 同 的 项 目 。 在 采集 
标本 时 ，Biotracks 可 以 记录 采集 信息 ， 并 把 相应 的 数据 和 文件 同步 至 云端 。 之 后 ， 每 个 成 
员 记 录 的 数据 会 被 自动 整合 到 相应 的 项 目 内 , 成 员 可 以 在 项 目 内 分 工 合作 , 项 目 统计 功能 会 
实时 统计 每 个 成 员 的 贡献 , 项 目地 图 则 可 以 将 整合 的 数据 绘制 为 热力 图 , 这 些 功 能 能 够 将 任 


— 


-=> 


— 


c 务 的 最 新 进展 传达 给 成 员 , 成 员 则 可 以 借助 它 更 好 地 规划 下 一 步 的 工作 .而 在 数据 管理 方面 ， 
ue Biotracks PLENUM es ARA 整合 的 数据 可 以 被 批量 下 载 后 提交 给 
O 标本 馆 ， 标 本 馆 也 可 以 直接 通过 Biotracks 的 授权 接口 主动 调 取 采 集 信息 ， 然 后 应 用 于 相应 


的 标本 数字 化 。 
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Kingdonia 或 其 他 数字 标本 馆 系统 Biotracks 多 媒体 存储 


7 利用 Biotracks 构建 的 标本 收集 流程 
Fig.7 Specimen collection process constructed by Biotracks 

通过 信息 化 的 手段 和 体系 化 的 设计 ，Biotracks 不 仅 可 以 自然 的 融入 到 标本 收集 流程 中 
的 各 个 环节 ， 还 很 好 地 解决 了 一 些 传统 标本 收集 流程 中 国有 的 问题 ， 这 包括 : (1) 数据 规 
范 难以 被 彻底 地 贯彻 (Biotracks 采用 了 统一 的 数据 模板 记录 数据 ， 字 段 名 、 值 类 型 、 值 样 
式 都 得 到 了 很 好 地 约束 ) ; (2) 数据 提交 和 汇总 费时 费力 (Biotracks 会 自动 整合 项 目 成 员 
的 数据 ， 有 权限 的 成 员 可 以 批量 下 载 ) ; 030 野外 工作 的 成 果 和 进展 不 能 被 及 时 地 共享 和 
感知 (Biotracks 能 够 将 项 目 数据 共享 给 所 有 成 员 ， 同 时 会 实时 统计 各 个 成 员 的 贡献 ， 还 会 
将 采集 记录 绘制 成 热力 地 图 展现 给 成 员 ) ; (4) 数据 无 法 被 长 期 追踪 (Biotracks 将 数据 存 
于 云端 ， 数 据 的 编辑 和 修改 都 可 以 同步 更 新 至 各 个 成 员 的 最 新 设备 之 中 ) ; C50 植物 标本 
采集 信息 的 数字 化 主要 依靠 人 工 转录 〈 标 本 馆 可 以 导入 或 调 取 Biotracks 记录 的 采集 信息 ， 
避免 人 工 二 次 转录 ) 。 

相 较 于 传统 的 标本 收集 流程 通常 会 按照 时 序 依次 组 织 各 个 工作 环节 ，Biotracks 所 塑造 
的 流程 , 则 可 以 让 各 类 人 员 形成 跨越 时 空 的 分 工 合作 , 它 不 仅 能 够 提升 标本 收集 过 程 中 各 个 
环节 以 及 整个 流程 的 工作 效率 ,还 能 够 从 根本 上 改变 传统 数据 流 的 整合 方式 ， 因此， 应 该 被 
视 为 一 种 新 的 标本 收集 流程 ， 作 用 于 新 进 标本 的 收集 。 对 于 最 终 的 标本 ,该 模式 能 够 将 原生 
的 照片 与 数字 标本 自然 的 形成 关联 ， 从 而 将 收藏 于 标本 馆 的 标本 与 现实 场景 联系 在 一 起 , 这 
种 影响 目前 我 们 还 无 法 准确 的 评估 , 但 对 科学 研究 而 言 , 标本 数据 一 直 都 是 生物 多 样 性 数据 
的 金 标准 (Culley, 2013) ， 新 的 标本 藻 能 以 这 种 形式 进行 大 量 的 富 集 ， 其 潜质 必 将 是 令 人 
期 待 的 。 
3.3 Biotracks 为 国内 植物 标本 馆 的 发 展 带 来 了 公众 科学 

采集 者 利用 Biotracks 记录 标本 采集 信息 ,标本 馆 调 用 这 些 信息 转录 标本 ,其 中 的 效率 
提升 实际 上 是 因为 标签 转录 工作 被 分 包 给 了 各 个 标本 采集 者 。 这 种 借助 众人 力量 解决 科学 数 
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据 甚 至 科学 研究 问题 的 模式 ， 被 统称 为 公众 科学 〈 张 健 等 ，2013; 金 瑛 等 ，2019) 。 利 用 公 
众 科 学 解决 标本 馆 的 问题 ， 其 实 并 不 罕见 。 比 如 标本 标签 的 转录 ， 国 外 就 有 一 些 公共 平台 专 
门 帮助 各 类 标本 馆 和 博物 馆 转 录 标 本 标签 [比如 Note From Nature (Hill et al., 2012) ]， 一 些 
博物 馆 还 会 建立 自己 的 转录 平台 以 支持 公众 参与 博物 馆藏 品 的 标签 转录 (比如 史 密 森 数字 志 
愿 者 转录 中 心 ，https://transcription.si.edu) ， 有 些 组 织 甚至 还 会 为 此 举办 国际 性 的 标签 转录 
竞赛 [比如 WeDigBio (Ellwood et aL, 2018) ]。 然 而 在 国内 ， 标 本 馆 对 于 公众 科学 的 关注 、 
让 用 和 研究 却 很 不 理想 。 这 其 实 和 国内 植物 标本 馆 的 发 展 模式 有 很 大 的 关系 : 一 方面 我 国 的 
现代 植物 学 如 同 其 他 科学 门类 一 样 ， 属 于 舶 来 品 ， 因 此 与 西方 社会 相 比 ， 自 然 博物 的 社会 基 
础 并 不 好 。 另 一 方面 ， 植 物 标本 馆 最 初 的 价值 就 是 收纳 标本 以 支持 标本 的 研究 ， 因 此 相 比 面 
向 公众 的 各 类 博物 馆 , 它 与 公众 的 关系 更 为 疏远 。 这 些 因素 造成 了 国内 植物 标本 馆 的 发 展 一 
直 以 来 都 很 难 扎根 于 公众 ， 导 致 最 终 只 能 依附 于 植物 分 类 学 的 发 展 。 然 而， 由 于 《中 国 植物 
志 》、Flora of China 等 全 国 性 志 书 已 经 完成 ， 更 由 于 政策 导向 等 诸多 因素 的 影响 ， 当 前 中 
国 植物 分 类 学 的 境遇 也 不 太 好 , 而 与 之 紧密 相关 的 植物 标本 馆 自然 也 面临 着 严峻 的 生存 和 发 
展 问题 〈 马 金 双 ，2010) . 

但 是 国内 植物 标本 馆 的 发 展 机 遇 仍然 是 存在 的 。 这 与 科学 研究 的 总 体 发 展 趋势 有 很 大 的 
关系 。 比 如 近年 来 标本 馆 的 标本 数字 化 就 受到 了 前 所 未 有 的 重视 。 数 字 标 本 作为 实体 标本 的 
SE, 起 初 只 是 方便 了 标本 的 检索 和 查阅 ， 然 而 随 着 数据 的 富 集 ， 数 字 标 本 的 价值 已 经 不 再 
局 限于 植物 分 类 学 的 研究 ， 而 延伸 至 环境 变化 、 保 护 生 物 学 、 群 体 遗 传 学 与 基因 组 学 ， 其 至 
公共 健康 与 安全 等 领域 CEllwood et al., 2018) 。 对 于 严重 依赖 分 类 学 研究 的 传统 标本 馆 而 
言 ， 这 不 仅 扩展 了 标本 馆 的 生存 基础 ， 还 为 标本 馆 带 来 了 实 实在 在 的 经 费 支 持 。 比 如 中 国 数 
字 植 物 标 本 馆 (CVH) 每 年 都 会 支持 数 十 家 标本 馆 的 标本 数字 化 工作 〈 刘 慧 圆 等 ，2017) ， 
相应 的 经 费 可 能 不 算 多 ,但 对 于 极度 缺乏 经 费 支 持 的 标本 馆 ， 也 是 雪中送炭 。 而 数字 标本 之 
所 以 有 如 此 广泛 的 科学 价值 ， 其 实 并 非 偶然 。2009 年 ， 微 软 针对 数据 密集 型 科学 提出 了 第 
四 研究 范式 (Hey et al., 2009) ， 之 后 的 十 多 年 随 着 智能 手机 ，3G、4G、5G 蜂 久 网 络 ， 计 
算 机 硬件 ， 物 联网 ， 云 存储 ， 云 计算 ， 人 工 智能 等 技术 的 发 展 ， 大 规模 数据 的 获取 、 管 理 与 
利用 能 力 已 经 获得 了 质 的 飞跃 (Madden, 2012; McAfee et al., 2012; Ge et al., 2018; Oussous et 
al., 2018) 。 这 使 得 基于 数据 密集 型 的 科研 第 四 范式 开始 真正 从 理论 发 展 转向 实践 应 用 ， 数 
据 的 价值 因此 被 充分 的 释放 和 展现 ,而 标本 数据 的 富 集 和 利用 , 正 是 这 一 趋势 下 的 一 个 实例 。 
因此 , 现代 标本 馆 的 科学 价值 不 仅 在 于 所 收藏 的 标本 ,还 在 于 它 能 带 来 的 数据 价值 。 与 
标本 馆 紧 密 相关 的 地 面 生 物 多 样 性 数据 的 收集 、 整 理 和 利用 ， 属 于 典型 的 人 力 密集 型 活动 ， 
而 这 正 是 公众 科学 所 擅长 的 领域 。 同 时 ， 伴 随 着 我 国 公众 科学 素养 的 不 断 提 高 〈 何 逢 等 ， 
2018) ， 以 及 国家 层面 对 于 生态 安全 与 生物 多 样 性 的 保护 的 进一步 重视 (陆军 ，2019) ， 国 
内 开展 类 似 公 众 科 学 活动 的 条 件 已 经 成 熟 。 而 Biotracks 的 核心 目标 之 一 ， 就 是 希望 将 各 类 
公众 的 力量 , 通过 信息 技术 手段 与 标本 馆 形 成 对 接 ， 从 而 解决 标本 馆 在 大 规模 物种 数据 的 收 
集 、 鉴 定 、 提 取 、 利 用 等 方面 所 遭遇 的 人 力 和 智力 资源 匮乏 等 问题 。 比 如 对 于 野外 调查 活动 ， 
标本 馆 可 以 通过 Biotracks 发 布 科 考 志愿 者 招募 , 从 而 解决 野外 调查 中 人 力 资 源 不 足 的 现状 
Chttp:Wwww.biotracks.cn/activity) 。 对 于 标本 的 转录 ， 调 用 Biotracks 数据 转录 标本 ， 既 能 
提高 效率 ,还 可 以 降低 转录 的 难度 ， 同 样 也 有 益 于 招募 公众 参与 标本 的 数字 化 。 而 作为 未 来 
Biotracks 的 工作 重心 之 一 ， 类 似 iNaturelist 和 Biotracks 这 样 的 自然 观察 平台 ， 聚 集 了 大 
量 的 专业 人 员 和 分 类 学 爱好 者 , 他 们 对 于 物种 的 鉴定 和 讨论 也 完全 可 以 推送 给 与 之 相关 的 数 
字 标 本 。 从 而 使 得 传统 标本 低 效 、 低 频率 的 鉴定 和 讨论 得 以 改善 ， 并 最 终 推动 物种 的 鉴定 和 
发 现 向 着 社区 驱动 的 方向 发 展 (Heberling & Isaac, 2018) 。 

诸如 此 类 的 工作 ,其实 还 有 很 大 的 扩展 空间 ， 通过 Biotracks 我 们 看 到 了 公众 科学 对 于 
现代 标本 馆 的 价值 ， 而 在 公众 科学 活动 中 ， 标 本 馆 其 实 也 有 自己 独特 的 价值 : 〈1) 作为 一 
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个 专业 机 构 , 首先 它 有 普通 个 体 难 以 比拟 的 号 召 力 , 这 对 于 公众 科学 的 发 起 和 组 织 是 至 关 重 
要 的 ; (2) 标本 馆 可 以 接触 到 大 量 的 专业 人 员 ， 容 易 和 他 们 产生 合作 ， 共 同 开 展 公众 科学 
活动 (3) 标本 馆 有 大 量 的 植物 标本 ， 这 些 标本 的 潜在 价值 是 惊人 的 ， 借 助 公众 科学 的 手 
段 可 以 深度 挖掘 标本 的 价值 , 创作 具有 更 高 科学 价值 的 数据 产品 ， 比 如 联合 公众 从 标本 图 片 
上 提取 花期 、 果 期 等 物候 数据 集 (Willis et al., 2017) ; (4) 除了 深 挖 标本 的 价值 ， 标 本 馆 自 
身 的 专业 能 力 和 区 位 优势 也 应 该 是 构建 数据 价值 的 重要 力量 , 比如 我 们 是 否 可 以 考虑 将 主导 
和 维护 特定 区 域 和 特定 内 容 的 自然 观察 数据 集 作为 标本 馆 未 来 的 核心 价值 之 一 呢 ? 
3.4 与 类 似 方案 的 比较 
普 助 类 似 Biotracks 这 样 的 公众 科学 平台 所 提供 的 开放 应 用 采集 植物 标本 , 然后 再 将 其 
与 标本 馆 (博物 馆 ， 的 标本 收藏 工作 相 结 合 ， 在 国外 也 有 案例 可 循 。iNaturalist 
(https://www.inaturalist.org ) 是 目前 国外 发 展 非常 迅速 的 自然 观察 平台 , 用 户 使 用 iNaturalist 
的 APP 或 网 站 提交 物种 的 发 现 记 录 ，iNaturalist 会 将 这 些 记录 分 享 给 用 户 社区 进行 交流 和 
鉴定 。2018 年 11 月 的 一 篇 公开 文献 (Heberling & Isaac, 2018) 分 享 了 iNaturalist 针对 植 
物 标本 收集 的 一 些 拓展 ， 总 体 而 言 与 笔者 之 前 对 Biotracks 的 简要 说 明 ( 徐 洲 锋 ，2018) 以 
及 在 本 文中 进一步 描述 的 模式 基本 一 致 。 但 两 者 在 具体 实现 上 ， 也 有 一 些 差异 ， 这 些 差异 包 
pus 括 以 下 几 个 方面 。 
T 3.4.1 项 目 创建 iNaturalist 的 标本 采集 项 目 必 须 在 网 页 端 创建 ，Biotracks 的 项 目 则 必须 在 
手机 端 创建 ，iNaturalist 对 创建 者 会 有 一 定 的 要 求 〈 至 少 有 50 条 被 验证 的 物种 观察 记录 才 
可 以 创建 项 目 ) ，Biotracks 暂时 没有 这 方面 的 限制 。 
3.4.2 项 目 公 开 iNaturalist 的 标本 采集 项 目 是 对 外 公开 的 , 任何 用 户 都 可 以 看 到 和 参与 这 个 
项 目 ，Biotracks 则 将 项 目 分 成 了 公开 、 团 队 、 私 有 三 种 类 型 ， 不 同类 型 有 不 同 的 开放 度 : 
iNaturalist 会 将 项 目 记 录 开 放 给 所 有 用 户 浏览 和 鉴定 ，Biotracks 的 项 目 记 录 只 会 分 享 给 项 
目 成 员 。 
3.4.3 数据 标准 iNaturalist 的 标本 采集 项 目 , 数据 模版 除了 核心 字段 之 外 ,其 他 字段 可 由 用 
户 自 行 定义 ; Biotracks 也 支持 定制 ， 但 并 没有 把 定制 的 权限 交 给 用 户 ， 针 对 不 同类 群 ， 
Biotracks 采取 了 平台 定制 ， 用 户 使 用 的 模式 ， 以 确保 数据 的 强 一 致 性 。 
3.4.4 应 用 重心 iNaturalist APP. 更 加 轻 量 , 一 些 关 键 信息 的 记录 ,比如 地 理 坐 标 有 束 于 网 络 
或 关联 图 片 的 支持 , H APP 目前 尚 不 支持 海拔 高 度 的 获取 ,项 目 数据 的 统计 分 析 和 可 视 化 
展示 也 更 多 的 集成 在 网 页 端 ，Biotracks 手机 端 功 能 更 加 丰富 ， 能 够 不 依赖 网 络 记录 坐标 和 
海拔 信息 ， 同 时 倾向 于 将 更 多 的 功能 集成 到 移动 端 ， 而 网 页 端的 功能 则 相对 较 弱 。 
3.4.5 资源 标识 、iNaturalist 希望 在 自己 的 平台 上 为 每 条 记录 生成 一 个 永久 的 URL 链接 , 以 
固定 标本 的 引证 ; Biotracks 更 希望 将 采集 记录 注册 到 一 个 开放 的 第 三 方 资源 标识 符 平台 ( 比 
如 https://noi.link〉， 以 统一 不 同 来 源 物种 记录 的 数字 标识 符 。 
这 些 差异 ， 有 些 是 环境 因素 造成 的 〈 比 如 iNaturalist 相 比 Biotracks 更 加 开放 ， 主 要 
是 因为 西方 国家 在 公众 科学 领域 的 发 展 更 超前 , 特别 是 与 此 有 关 的 数据 共享 实践 要 比 国内 更 
加 成 熟 ， 而 Biotracks 目前 综合 考虑 了 各 方面 因素 ， 尚 无 法 贸然 主动 公开 所 有 用 户 的 数据 
但 Biotracks 也 在 积极 探索 新 的 方式 ， 以 期 在 符合 国情 的 情况 下 ， 尽 可 能 促进 数据 分 享 ) 。 
有 些 是 由 于 发 展 理念 不 同 造成 的 差异 《比如 资源 的 标识 ，Biotracks 认为 领域 需要 有 统一 的 
数字 标识 符 ， 因 此 并 不 赞成 平台 将 自身 的 固定 地 址 应 用 在 标本 资源 上 ) 。 有 些 则 是 由 各 自 所 
处 的 发 展 阶段 造成 的 〈Biotracks 先期 更 加 侧重 移动 端的 发 展 ， 但 未 来 也 需要 加 强 WEB 端的 
能 力 ) 。 但 整体 而 言 ， 这 两 个 平台 针对 标本 的 收集 所 构建 的 方案 可 谓 不 谋 而 合 。 当 然 ， 相 比 
iNaturalist，Biotracks 的 体 量 还 非常 的 小 ， 但 我 们 也 和 希望 Biotracks 能 够 在 未 来 中 国 植物 标 
本 馆 的 发 展 历程 上 留 下 自己 的 身影 。 
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